SPSS Wilcoxon 符号秩检验 – 简单示例
作者:Ruben Geert van den Berg,归类于 Statistics A-Z 和 Nonparametric Tests
当比较同一组个案上测量的两个度量变量时,我们的首选是配对样本 t 检验(paired-samples t-test)。 这要求差值在总体中服从正态分布。 如果不满足此假设,我们可以改用 Wilcoxon 符号秩检验(Wilcoxon Signed-Ranks test)。 它也可以用于有序变量,尽管对于李克特量表(Likert items)来说,结(ties)可能是一个真正的问题。
不要像 SPSS 那样,将“Wilcoxon 符号秩检验”简写为“Wilcoxon 检验”:还有第二个“Wilcoxon 检验”,也称为 Mann-Whitney 检验,用于两个_独立_样本。
Wilcoxon 符号秩检验 - 基本原理
- 对于每个个案,计算 score_1 和 score_2 之间的差值。
结(两个值相等的个案)将完全从该检验中排除。
- 计算每个个案的绝对差值。
- 对个案的绝对差值进行排序。
对结使用平均秩(具有相等绝对差值分数的不同个案)。
- 通过将差值的符号(正号或负号)应用于秩来创建带符号的秩。
- 计算检验统计量
Wilcoxon W+,它是正号秩的总和。 如果 score_1 和 score_2 _确实_具有相似的总体分布,那么 W+ 既不应该非常小也不应该非常大。
- 从其精确的抽样分布计算 W+ 的 p 值,或者通过 标准正态分布 近似计算。
理论就到这里。 我们现在将在 SPSS 中对一些真实世界的数据运行 Wilcoxon 符号秩检验。
Adratings 数据 - 简要说明
一家汽车制造商让 18 名受访者对他们的一款汽车的 3 个不同的广告进行评分。 他们首先想知道哪个广告被所有受访者评价最高。 这些数据(其中一部分如下所示)位于 adratings.sav 中。
快速数据检查
我们当前的重点仅限于 3 个评分变量,ad1 到 ad3。 首先,让我们确保我们对它们的基本外观有所了解,然后再继续。 我们将通过运行以下语法来检查它们的直方图。
基本直方图语法
***使用直方图检查数据看起来是否合理。***
frequencies ad1 to ad3
/format notable
/histogram.
直方图 - 结果
首先,我们的 3 个直方图没有显示任何奇怪的值或模式,因此我们的数据看起来可信,并且无需指定任何 用户缺失值。
让我们也看一下直方图中的描述性统计量。 每个变量都有 n = 18 个受访者,因此根本没有任何缺失值。 请注意,ad2(“Youngster car commercial”)的平均评分非常低,只有 55。 决定从分析中删除此广告,并检验 ad1 和 ad3 是否具有相等的平均评分。
差值
现在让我们使用以下语法计算并检查 ad1 和 ad3 之间的差值。
***计算差值。***
compute diff = ad1 - ad3.
***检查直方图差值以确定正态性。***
frequencies diff
/format notable
/histogram normal.
结果
我们比较这些变量的首选方法是 配对样本 t 检验。 这要求差值在总体中呈正态分布,但我们的样本表明并非如此。 对于较大的样本量(例如,n > 25),这不是问题,但我们的数据中只有 18 名受访者。 对于较大的样本量,中心极限定理 确保均值的 抽样分布 将呈正态分布,而与变量的总体分布无关。 幸运的是,Wilcoxon 符号秩检验正是为此场景而开发的:不满足配对样本 t 检验的假设。 只有现在我们才能真正制定我们的 零假设:ad1 和 ad3 的总体分布是相同的。 如果这是真的,那么这些分布在我们手头这样的小样本中会_略有_不同。 但是,如果我们的样本显示出_非常_不同的分布,那么我们关于相等总体分布的假设将不再成立。
SPSS 中的 Wilcoxon 符号秩检验 - 菜单
现在我们对数据的基本外观有了一个基本的了解,让我们运行我们的检验。 以下屏幕截图将指导您完成。
2 Re_l_ated Samples 指的是比较在同一受访者身上测量的 2 个变量。 这类似于 重复测量方差分析 中的“配对样本”或“受试者内”效应。
(可选)反转变量顺序,以便您在 Variable2 下获得最高分(我们数据中的 ad1)。
“Wilcoxon”指的是此处的 Wilcoxon 符号秩检验。 这与 Wilcoxon 独立样本检验(也称为 Mann-Whitney 检验)是不同的检验。
_E_xact 可能存在,也可能不存在,具体取决于您的 SPSS 许可证。 如果您有它,我们建议您按如下所示填写它。
SPSS 中的 Wilcoxon 符号秩检验 - 语法
按照这些步骤会产生以下语法(如果您请求了精确统计量,则会多一行)。
***Wilcoxon 符号秩检验语法。***
NPAR TESTS
/WILCOXON=ad2 WITH ad1 (PAIRED)
/MISSING ANALYSIS.
Wilcoxon 符号秩检验 - 秩表输出
让我们先盯着这个表格及其脚注看一会儿,并破译它真正说了什么。好的。 现在,如果 ad1 和 ad3 具有相似的总体分布,那么符号(加号和减号)应该大致均匀地分布在秩上。 如果您发现这很难掌握(像大多数人一样),请再次查看此图表。
这意味着正秩的总和应该接近负秩的总和。 这个数字(在我们的示例中为 159)是我们的检验统计量,称为 Wilcoxon W+。
我们的表显示了一个非常不同的模式:正秩的总和(表明“Family car”的评分更高)远大于负秩的总和。 我们还能相信我们的 2 个广告的评分相似吗?
Wilcoxon 符号秩检验 - 检验统计量输出
奇怪的是,我们的“检验统计量”表包含了除我们实际的检验统计量(即上述 W+)之外的所有内容。
我们更喜欢报告 Exact Sig. (2-tailed)。 它的值为 0.001 意味着,如果我们的变量确实具有相似的总体分布,那么找到我们所做的大样本差异的概率大约为千分之一。
如果我们的输出不包含精确的 p 值,我们将改为报告 Asymp. Sig. (2-tailed),它也是 0.001。 这个近似 p 值基于标准正态分布(因此“Z”位于其顶部)。 “Asymp”是渐近线的缩写。 这意味着随着样本量接近无穷大,W+ 的抽样分布变得与正态分布相同。 或者更实际地说:这种正态近似对于较大的样本量更准确。
令人欣慰的是,两个 p 值都是 0.001。 显然,正态近似是准确的。 但是,如果我们增加小数位数,我们会看到它几乎是精确 p 值的 3 倍。 从 设置输出表的小数位数工具 可以下载一个不错的工具来做到这一点。
拥有两个 p 值的原因是精确 p 值在计算上可能很繁重,尤其是对于较大的样本量。
如何报告 Wilcoxon 符号秩检验?
报告这些结果的官方方式如下:“Wilcoxon 符号秩检验表明,“Family car”广告(平均秩 = 10.6)的评分比“Youngster car”广告(平均秩 = 4.0)更高,Z = -3.2,p = 0.001。” 我们认为此指南对于较小的样本量而言较差。 在这种情况下,Z 近似可能是不必要的且不准确的,并且最好使用精确的 p 值。